Datenanalyse in den Digital Humanities - Eine Annäherung an Kostümmuster mittels OLAP Cubes
نویسندگان
چکیده
Im Film ist das Kostüm eines der prominentesten Gestaltungselemente, um Aussagen über eine Rolle, deren Charakter, Stimmung und Transformation, wie auch über Ortund Zeitgegebenheiten zu kommunizieren. Durch Kostümmuster sollen Kostümbildner befähigt werden, effizient auf bewährte Designlösungen zurückgreifen zu können. Diese Demo zeigt, wie generelle Designprinzipien aus einer großen Anzahl an Kostümen aus Filmen für die Entwicklung dieser Kostümmuster mittels OLAP Cubes abstrahiert werden können. Um generelle Designprinzipien feststellen zu können, werden Kostüme über kategoriale Merkmalstaxonomien beschrieben und in verschiedenen Aggregationsstufen ausgewertet. Die Abstraktion von generellen Lösungen für Kostümmuster wird durch Drill-Down und Roll-Up Mechanismen unterstützt. 1 Einleitung und Motivation Muster und Mustersprachen sind in vielen Domänen ein weit verbreitetes Mittel, um erprobtes Lösungswissen zu wiederkehrenden Problemen zu erfassen und dieses Wissen effizient für andere nutzbar zu machen. Aus der Architektur kommend [AIS77], hat sich das Konzept des Musters in der Informatik weit verbreitet. Dies lässt sich durch die Vielzahl an Publikationen aus den verschiedensten Bereichen der Informatik belegen, wie z.B. Cloud-Applikationsarchitektur, Unternehmens-IT-Architektur, Green-IT, Applikationssicherheit oder Benutzerschnittstellendesign, um nur einige zu nennen. Aber auch in anderen Domänen, wie der Pädagogik oder der Produktentwicklung, hat das Konzept des Musters erfolgreiche Anwendung gefunden. Auch in der Domäne von Kostümen in Filmen erscheint der Einsatz von Mustern vielversprechend, indem adäquate textile Ausdrücke für Charaktere, die einfach vom Rezipienten verstanden werden (wie kommuniziert man beispielsweise einen guten Sheriff gegenüber einem bösen Sheriff mittels eines Kostüms?) als Lösungen wiederkehrender Designprobleme eines Kostümbildners in Mustern abgefasst werden [SBL12]. Als ein Projekt der Digital Humanities, bei dem sich geisteswissenschaftlichen Fragestellungen mittels neuer Methoden aus der Informatik genähert werden soll, wird durch interdisziplinäre Institut für Architektur von Anwendungssystemen Universität Stuttgart Universitätsstraße 38 70569 Stuttgart [email protected] Hochschule Reutlingen Herrmann Hollerith Zentrum Alteburgstr. 150 72762 Reutlingen [email protected] Forschung von Informatikern und Geisteswissenschaftlern eine Mustersprache für Kostüme im Film entwickelt [SBL12]. Basierend auf einem repräsentativen Fundus an Filmen (60 Filme mit jeweils ca. 200 Kostümen) wird eine Datenbasis – auch Lösungsrepository genannt [FBF14] – angelegt, in der Kostüme durch relevante Parameter, organisiert in Taxonomien, beschrieben werden [Ba13]. Jedes Kostüm in dieser Datenbasis repräsentiert eine konkrete Lösung für ein Designproblem. Im Gegensatz zu konkreten Lösungen im Lösungsrepository beinhalten Muster abstrahierte, generelle Lösungsprinzipien [FBB14]. Für die Formulierung von Mustern muss daher die Quintessenz aus einer Menge von Kostümen mit gleichem Effekt bezüglich eines Designproblems extrahiert werden [BL14]. In der Demo wird gezeigt, wie die Datenbasis mit Hilfe von Online Analytical Processing (OLAP) Cubes ausgewertet werden kann, sodass Muster aus der Menge an konkreten Lösungen abstrahiert werden können. Dazu wird eine Werkzeugumgebung vorgestellt, die eine automatisierte Aufbereitung und Übertragung der Daten aus der Datenbasis in ein Data Warehouse (DWH) ermöglicht. Weiterhin wird gezeigt, wie das Datenbankschema des DWH aufgebaut sein muss, um performante OLAP Cubes für die Auswertung des Datenbestandes zu ermöglichen und wie die Analyse der Daten aus filmwissenschaftlichen Gesichtspunkten erfolgt. Nach der einleitenden Motivation in diesem Abschnitt, wird das grundlegende methodische Konzept der Auswertung in Zusammenhang mit dem Datenmodell der auszuwertenden Kostüme in Abschnitt 2 beschrieben. In Abschnitt 3 wird die Architektur des zu demonstrierenden Systems erläutert, während diese Arbeit mit einer Beschreibung des Ablaufs der Demo in Abschnitt 4 schließt. 2 Datenmodell und methodisches Konzept Dem vorgestellten Konzept liegt eine Datenbasis mit konkreten Designlösungen (Kostümen) zugrunde. Ein Kostüm besteht aus mindestens einem Basiselement, wobei ein Basiselement einem Kleidungsstück wie z.B. einem Hemd entspricht. Ein Basiselement setzt sich aus mehreren Teilelementen wie Hemdkragen oder Knopfleiste zusammen. Basisund Teilelemente werden durch Attribute wie Farbe, Form, Material oder Zustand beschrieben, während zur Beschreibung eines Kostüms Attribute wie Charaktereigenschaft, Funktion, Zustand oder Körpermodifikation herangezogen werden. Damit Kostüme im Kontext von rollenbzw. filmspezifischen Attributen ausgewertet werden können, werden sie mit genau einer Rolle verknüpft, welche wiederum genau einem Film zugeordnet ist. Eine Rolle wird durch Attribute wie Beruf, Alter, Familienstand, Geschlecht oder Stereotyp spezifiziert. Attribute wie Erscheinungsjahr, Genre, Produktionsort oder Stil werden zur Beschreibung eines Films verwendet. Eine komplette Auflistung der Attribute aller Entitäten und deren Semantik ist in [Ba13] zu finden. Um wiederkehrende Kostümmuster abstrahieren zu können, müssen Ausprägungen von Attributen und Attributskombinationen der Kostüme in der Datenbasis einfach vergleichbar gemacht werden. Zu diesem Zweck werden Taxonomien vorgegeben, die den Wertebereich der Attribute festlegen und eine einheitliche Begrifflichkeit bei der Beschreibung von Kostümen gewährleisten [Ba13]. Die Attribute einer Entität können somit als pivotierbare Dimensionen mit kategorialen Ausprägungen verwendet werden, um neue Sichten zur Analyse des Datenbestandes zu generieren. Zusätzlich definiert jede Taxonomie eine Hierarchie von Superund Subtypen. Dadurch können Kostüme über den Vergleich von Attributskombinationen über unterschiedliche Abstraktionsstufen hinweg auf gemeinsame Ausprägungen hin untersucht werden. Abbildung 1 zeigt exemplarisch ein Auswertungsszenario, in dem analysiert wird, wie oft Basiselemente des Typs Kleid eine spezifische Farbausprägung haben. Dafür werden Basiselementtypen vertikal und Farben horizontal angeordnet. Die Zahlen im rechten Teil der Abbildung entsprechen dem Auftreten der entsprechend vertikal bzw. horizontal zugehörigen Merkmalsausprägungen. So existieren im Beispiel insgesamt 4 Basiselemente des Typs Kleid mit der Farbe Rot sowie 3 gelbe und 2 blaue. Durch die hierarchische Struktur der Basiselementtypen kann die Analyse detailliert werden, indem durch einen Drill-Down angezeigt wird, wie viele Basiselemente der Subtypen Abendkleid und Sommerkleid entsprechend rot, gelb und blau sind. Damit wird ersichtlich, dass bei der Aggregation das Auftreten von Merkmalsausprägungen von Subtypen aufsummiert wird. Der höchste auswertbare Detaillevel ist mit den Blattelementen einer Taxonomie festgelegt, im Beispiel ist dies für die Basiselementtypen das schulterfreie Kleid und das One-Shoulder Kleid. Über dieses Prinzip der Aggregation von konkreten Typen hin zu abstrakteren Typen – Roll-Up genannt – können Zusammenhänge auf dem Level von Merkmalskategorien ausgewertet werden. Abbildung 1: Aggregation über Kategorieebenen von Merkmalstaxonomien
منابع مشابه
Anwendungsspezifische Adaption und Erweiterung von OLAP-Anwendungen auf Basis von MDX
Die Anforderungen an OLAP-Systeme (Online Analytical Processing) [Pendse, 1998] verschieben sich von z.B. wöchentlichen zu immer kürzeren Aktualisierungsintervallen bis hin zu Auswertungen, die den aktuellen Stand des operativen Systems darstellen. Zugleich vervielfachen sich die auszuwertenden Daten. Dabei werden Funktionalitäten der Frontends wie eine zentrale einfache Schnittstelle, die nebe...
متن کاملIntegration von ETL und OLAP in die relationale DWH-Technologie: mehr Lösung für weniger Aufwand?
Seit vielen Jahren werden Lösungen für Datawarehouse Themen schon nach dem gleichen Schema entwickelt. Dies ist nicht weiter verwunderlich, da doch die Anforderungen –eigentlichimmer ähnlich sind: Daten aus verschiedenen Quellsystemen sollen, unter diversen Randbedingungen, analysiert werden. Auch wenn sich Technologien weiter entwickelt haben, Schnittstellen nun bereits out-of-the-box verfügba...
متن کاملModellgetriebene semi-automatische Bereitstellung von Analytischen Informationssystemen
Analytische Informationssysteme werden von Organisationen immer häufiger zur Informationsversorgung und Entscheidungsunterstützung eingesetzt [Fri07]. Vielfach werden hierfür Analytische Informationssysteme mit zu Grunde liegender Informationslogistik (IL)Infrastruktur verwendet. IL-Infrastruktur beschreibt den bei Analytischen Informationssystemen über Insellösungen in Fachabteilungen hinaus g...
متن کاملEine Grundfrage der Datenanalyse: Addiert oder multipliziert die Natur?
Bei der Datenanalyse landwirtschaftlicher Versuche wird bislang fast standardmäßig von der Normalverteilung ausgegangen. Hier zeigen wir, dass die alternative, ähnlich einfach handhabbare logarithmische Normalverteilung vielfach die Daten besser beschreibt und effizienter ist. Das ist im Einklang mit den häufig multiplikativen Effekten als Ursache von quantitativer Variation.
متن کاملKonzept einer MSS Assistenz mittels Softwareagenten
Durch die zunehmende Funktionsvielfalt der heutigen Management Support Systeme (MSS) werden immer höhere Anforderungen an die Anwender im Umgang mit diesen Systemen gestellt. Zur Unterstützung bei der Problemlösung stehen den Anwendern oft nur die von den MSS-Tool-Anbietern mitgelieferten Online-Hilfen und Dokumentationen zur Verfügung. Diese sind punktuell und anwendungsunabhängig ausgerichtet...
متن کامل